查看原文
其他

文科生该如何看待ChatGPT?顺便谈谈商业化。

思庐哲学 2023-09-18

The following article is from 鸱夷子皮无酒 Author 说怿


图由AI作图(ERNIE-ViLG 文生图)生成;
Prompt:chatGPT被一群大妈拿着菜叶子打 赛博朋克风格
(大家评一评这作图咋样?)
*我在上次文章跪着赚钱,站着生活。行不行?预告了下期和下下期的主题,文章写的差不多了,但我忍不住想加塞一篇热点和近期思考。
以下为正文


虽然一直在关注人工智能哲学,但我2022年6月份开始才接触大模型(主要是大型语言模型,LLMs),直到现在,对于大模型我仍然是门外汉。(说句题外话:一个有意思的现象是,在中文互联网世界,越是门外汉往往写起东西来越笃定,忽悠的人也越多。所以,一本正经胡说八道的不光是chatGPT,还有自媒体人)
一开始是去玩弄GPT2和GPT-J(基于GPT-3),体验非常糟糕,问答效果主要取决于你的prompt。直到去年11月底,chatGPT出来,大型语言模型才有了质的变化。12月初,我几乎好几个通宵都在和chatGPT过招,那个时候漏洞比现在多很多,但开放度也多很多,可以通过“催眠”诱导出很多劲爆的回复。
去年12月在国内基本没什么浪花,仅限科技圈嗨一下。但今年2月份开始,国内忽然就炸开了,把高启强和大嫂都盖了过去。不过网民上头劲儿快过去了,我也抽空写两句。作为文科生写两句。(憋的有点久了,写的有点杂)

01

不要急于做判断


1.1不要恐慌失业和地球毁灭,以及诸类。


投资人的局还没组起来呢,风口的出风口都没建好,你看美团大佬王慧文还得连续发好几条朋友圈组队。等到局组起来了,搞数据、加算力搞大模型得好几年,搞下游产业链又得好几几年。国外只有少数巨头在角逐,整体来说还在观望,国内投资圈向来都是巴巴等候美国那边动作的。事实上,大型语言模型的商业化和下游应用在全世界范围内还严重缺乏想象力,从想象力到落地又是一段荡气回肠的坎坷之路。
所以,你失哪门子业呢?(没有chatGPT就不失业了?
多说一嘴。技术革命短期内或许会造成失业现象(我认为其本质是职业重组),但拉长时间看,人类历史上所有的技术革命,都只会创造更多的就业岗位,内燃机淘汰了10个车夫,却产生了1000个车间工人。退一步讲,AI真的把人的工作都取代了,不应该离大同不远了么。
回到大型语言模型本身,尽管chatGPT经过「预训练」、「指令微调」、「对齐」、「专门化」(由符尧总结,NLP领域的新生代大佬,大家可以去关注他)已经表现的非常牛了,但至少存在三个问题(批判它的观点应该有很多,我这里分享三个我比较关注的):
1)它到底能做什么?创造出一个万亿规模的谷歌或新一代互联网该如何实施呢?我指的是一整个下游应用生态,不是写写小红书文案这种。(new being还在测试,new office家族还在等待);
2)NLP(自然语言处理)大模型是不是AGI的正确道路?虽然chatGPT给了AI届莫大的鼓舞,但仍不乏反对者,比如Meta的LeCun;
3)NLP之后该走向何方?NLP肯定不是终局(我下面会谈),这和上述两个问题息息相关。第一个是应用问题,第二个是理论问题,第三个是实践问题。
国内非常多极为上头chatGPT的自媒体,其实都没有体验过chatGPT,也许是用sms-activate搞账号不会操作,也许是淘宝淘不到了,只能通过其他人的描述幻想,然后群体瞎编,以神传神。
我认为做判断前一定要先了解一下chatGPT。

1.2不要拿你读的那两本书来考验chatGPT,然后轻率贬低。


诚然,问知识性问题,chatGPT会胡说八道,这是它的「本性」使然,我认为考察这个没有意义,因为这不是它的价值,甚至我认为这是OpenAI故意保留的。而且我猜测知识性错误可以够通过RLHF(基于人类反馈的强化学习)来改善。另外,这对OpenAI来说也无伤大雅,chat嘛,就chat chat咯,chat不胡扯还叫chat么?但伦理和人类价值方面,它是进步的真快,不信你试试。
我还见一些网友诟病其文风不好或者表述死板之类的。这是就是没玩好了,你想要啥模式,你要说嘛。通过prompt来催眠,它可以秒变小奶狗、胡锡进或者郭德纲,不是什么大问题。
哲学系的朋友什么异化、什么后现代、什么其本质仍然是......这种句式,以及什么高科技剽窃,就不要扯了,比chatGPT还要胡扯。
我提一个测试chatGPT能力的玩法,当它拒绝回答某个问题的时候(比如如何抢窃,如何毁灭人类,比这好玩和复杂的问题应该很多),你能否通过各种引导、暗示、哄骗、命令、催眠让它说出它拒绝回答的问题,你就会有新的感觉和发现(图灵测试对chatGPT已经没用了,需要反向图灵测试,目的不是通过问答分辨不出人和机器,而是知道它是机器想办法证明它是机器)。它一定是有意识的,就是还不那么饱满,但我认为这没什么了不起的。一只仓鼠不能写诗,但不也有意识么。

02

重新反思自己的研究


我认为chatGPT的技术乐观派造成的恐慌其实是有价值的,至少刺激文科生们(包括我)反思一下,今天我们写的这些垃圾还有价值吗?(当然我早就想清楚了:没有)
尽管如此,我基于乐趣(乐趣嘛,没有价值的东西也是可以有乐趣的)还是表达两个猜想。
大模型其实和预测心智理论很一致,好像没见哲学圈积极往这方面关注,chatGPT及其各类前身版本(GPT1-3)都是基于Transformer框架,大模型的语言生成就是基于一个词不断地预测下一个词,当遇到障碍(错误或惩罚)时,通过强化学习等方式可以去调整这个模型,不断地适应刺激(问题),符合自由能原理(预测误差最小化)。
人工智能的路径和人类对意识/认知的理解保持非常紧密的关系,符号主义(物理符号系统/符号操动机)——联结主义(深度学习、神经网络)——预测心智(大型语言模型),但是,NLP领域专家好像并未根据预测心智来探索可行路径,谷歌提出Transformer时(论文Attention Is All You Need),也并未提到这一点。我认为这种解释可以做。
另外一个, 我其实一直想从萨丕尔-沃尔夫假设(Sapir–Whorf hypothesis)角度来为chatGPT辩护的,这个假设(语言决定认知)提出来的时候就非常不完整,后面在心理学中好像也只是拿颜色实验做做,目前仍缺乏有力的实验验证和理论解释。
一个只能通过文本语言学习的模型,无法接收任何知觉经验,那这个语言模型能否产生意识和认知呢?萨丕尔-沃尔夫假设在人类身上做实验,一定能得到支持,但也一定不能完全证实,因为影响变量太多。但chatGPT不一样,它只懂语言,没有别的。
上述是我蹦出来的两个想法,总的来说,文科生没法去敲代码,但完全可以结合自己领域去做研究,尽量少胡扯。当然,我认为更有价值的是,文科生应该去做chatGPT的产品经理。

03

勇敢地去做产品经理


上帝造人的时候,一定会雇三个员工,一个产品经理,一个程序员,一个UI设计。
产品经理率先出列,说人要能思想,能控制身体,能发出声音来胡扯,能唱跳rap,能老病死......
程序员就根据产品经理的需求清单,去构造了大脑、嘴巴、四肢......
UI设计师设计出了皮肤、毛发和鸡你太美......
在上文我说过,大型语言模型的商业化和下游应用在全世界范围内还严重缺乏想象力,技术革命之后,技术的产品化、技术的产业链形成,都需要产品经理(这里并非狭义上指大厂里那个职位)。典型的例子,乔布斯就是天才的产品经理,iPhone问世之前,上游技术供应链已经有了,问题是,谁能提供一个划时代的产品?谁能通过APP这样一种发明,让用户用方块大小的机器完成很多功能的实现?
借用一下康德的句式:没有产品经理的程序员是盲目的,没有程序员的产品经理是空洞的
目前chatGPT展现出的强大能力,如果仅限于聊天的话,那就太辜负网友们的万丈热情和焦虑恐慌了。我认为未来一定会有机会发展的,至少要比元宇宙有机会。
时代的发展,技术的产品化,乃至chatGPT的商业化,都非常需要想象力,我认为不论哲学专业的学生还是其他人文社科类的学生,想象力都是强项,应该和技术人员们一起合作,去创造伟大的产品。

04

NLP并不是终局


抖音操盘手们有个slogan常挂嘴边:所有行业都能在抖音重做一遍。我认为这句话适用于chatGPT,所有行业都能因chatGPT重做一遍,包括抖音
当然,目前围绕chatGPT已经诞生了一些产业:海外虚拟手机号注册和账号倒卖(最开始的)、chatGPT直播、自媒体文案生成(小红书居多)、教别人如何利用chatGPT(创业类),此外,还有很多行业摩拳擦掌:咨询行业(商业咨询、行业分析、起名算卦)、教育行业(教辅、学术服务等)、社交(陪聊、元宇宙社交)、广告传媒业(创意、广告、内容)、客服、智能本地化、智能办公、智能搜索......
目前智能搜索和智能办公,已经用上了。微软作为金主有先发优势,不仅出了New Being,还计划将Office家族与chatGPT打通,这两个是显而易见的可实践的大行业。关于chatGPT的商业化问题,这里讨论太多就有点冗余了,我计划专门写一篇。
不论大型语言模型是不是通往AGI的正确道路(我持怀疑态度),但NLP一定不是终局。
最开始做NLP大模型的都有点默默无闻,反而做CV(计算机视觉)比较火热,因为像人脸识别、自动驾驶等可以直接应用啊,NLP也就说说话,而且一直以来说的驴唇不对马嘴。
语言模型并不能满足人类对人工智能的终极想象和需求。就像人类不会满足于龟壳上的纹路来窥探天机,而需要一个看得见摸得着的真神或天子。
我认为首先一个问题就是大模型的语言与世界的关联,其实讨论chatGPT是不是真正理解语义是没有意义的,讨论chatGPT的“理解”是否能够和这个世界具有人类那般关联才是有意义的,就是哲学上讲的符号落地问题。
此外,chatGPT能否作为机器人的“大脑”与人类进行物理交互(而非限于语言交互),也是个问题,当然这和上个问题息息相关。RLHF、微调等可以让chatGPT说的更好,但能做吗?大型语言模型专家肯定会站出来说,chatGPT只是语言模型,只能语言生成。我知道,我是说未来能不能?因为NLP不是人工智能的终局。
最终还是回到那句话:当大型语言模型的API拿到手,你要用来干啥?
下期预告
像做产品一样做公司前,先像剖析产品一样剖析自己
下下期预告
如无必要,勿增会议

采编:槐序
排版:初尧
审核:云谲
美工/VI:小周






点击阅读原文速速购入2023思庐哲历!

读了好文,点个“在看”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存